На страницу второго семестра

Создание паттернов для поиска и распознавания аминокислотных последовательностей

Создание множественного выравнивания последовательности белка CYNS_ECOLI и 5-ти его гипотетических ортологов

В этом задании я провела ( при помощи программы BLASTP по банку Swiss-Prot) поиск гомологов моего белка ( CYNS_ECOLI ). Из них выбрала 5 наиболее вероятных ортологов (считали признаком ортологичности cовпадение названий белков из разных организмов, с процентом идентичности в диапазоне 40-80%, а E-value находки должно было быть не хуже (т.е., не больше) 0,001.
Были выбраны белки: cyns_mycpa, cyns_psesm, cyns_pseae,cyns_chrvo,cyns_pholl, так же мой белок cyns_ecoli. Сохранила последовательности полученных мной белков в формате FASTA. (orthologues.fasta )
С помощью программы muscle построила множественное выравнивание данных белков.
Выбрала (при помощи GeneDoc) консервативный участок выравнивания длинной 13 аминокислотных остатков для дальнейшего исследования:

                                                             
                                            *                
C Y N S _ M Y C P A   :   E Q F G D G I M S A I N F   :   1 3
C Y N S _ P S E S M   :   E Q F G D G I I S A I N F   :   1 3
C Y N S _ E C O L I   :   E K F G D G I I S A I N F   :   1 3
C Y N S _ P S E A E   :   E Q F G D G I I S A I N F   :   1 3
C Y N S _ C H R V O   :   E Q F G D G I I S A I N F   :   1 3
C Y N S _ P H O L L   :   E Q F G D G I I S A I D F   :   1 3
                          E   F G D G I   S A I   F          


Создание паттернов по множественному выравниванию и поиск по паттернам в банке данных Swiss-Prot

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности EKFGDGIISAINF 2 Найдено 2 белка (P58704, P00816), которые на самом деле являются штаммами.
Сильный E-[QK]-FGDGI-[MI]-SAI-[ND]-F 11 Все семь, выбранных мной белков (у ECOLI было два штамма, см. выше), были найдены, а также еще четыре (среди них два белка были даны для двух штаммов одного вида), которые были близки белкам, которые выбрала я.
Слабый E-X-F-{FW}-[DE]-G-[IL]-X-SAI-[NDEQ]-F 14 Найдены все последовательности (которые были найдены ранее), так как мы лишь ослабили предыдущий паттерн.


Комментарии:

В этом задании мы составляли различные паттерны дляразличных целей.
  1. Первый паттерн представляет из себя просто последовательность моего белка (cyns_ecoli) и предназначен для поиска именно моего белка. Данный паттерн нашел 2 белка, которые относились к разным штаммам Ecoli (поэтому я считаю, что паттерн справился с поставленной задачей).
  2. Второй паттерн представляет из себя последовательность, которая учитывала бы все аминокислоты, входящие в участки предполагаемых ортологов и моего белка, соответственно и находить он должен именно эти белки, но программа нашла их несколько больше, так как они были, по-видимому, близки.
  3. Слабый паттерн, я думаю, должен находить группу белков, которые выполняют ту же функцию, что и мой белок (об этом мы можем судить по первой части ID белка). В результате поиска по слабому паттерну я получила 14 белков, которые, как и предполагалось, принадлежали к одной группе ( Cyanate hydratase ), правда их число не велико, я пыталась ослабить паттерн еще сильнее, но результат не изменялся, что говорит о том, что данная последовательностей аминокислот довольно консервативна и может быть специфична для белков, выполняющих данную функцию.


©Babskaya Evgeniya, 2005